最近很多剛開始學FineBI的同學來問我,數據編輯該怎麼做。畢竟這是數據分析的第一步,這步搞不清楚,後面的數據分析就不好進行下去了。
因此,今天就好好和剛接觸FineBI的新朋友說一說數據編輯這件事。
本篇將會透過四步,帶大家瞭解一下Finebi的數據編輯功能。
在進行數據分析前,我們的數據結構往往不能直接開始分析,通常需要一些行列轉換,將數據處理成自己需要的欄位。
在FineBI中,我們透過數據編輯內封裝的功能**“拆分行列”“行列轉換”**就可以快速實現想要的效果。
原數據結構:
原始數據欄位內容混雜,不利於開展分析
處理后數據結構:
拆分行列並轉換後,欄位結構簡單清晰
實際的業務分析中,數據品質問題永遠是業務順利開展分析最大的攔路虎。
最常遇到的就是重複行問題。
在刪除這些重複行的時候,又會遇到兩種情況:
第一種是保留任意一行都不影響分析,例如“A、A、A”保留一個A即可。針對這種情況,**FineBI內封裝了“刪除重複行”**可以快速實現。
第二種情況是需要保留特定的一行。比如同一個客戶在系統中有兩行數據,我在分析時,需要有選擇的去保留最新錄入的一條。
遇到這種“A、B、C”只要取A的場景時,我們可以利用“刪除重複行”保留最上方一行的邏輯,先對數據表進行排序,再進行刪除重複行的操作。
功能封裝,選擇去重欄位快速去重
而表頭的快捷操作,也讓檢查重複行變得更加簡單:
表頭下拉選單對欄位內容進行統計,重複行快速發現
null值作為一個必定會遇到的問題,在不同的業務場景下會有截然不同的處理方式。
在數據量巨大的時候,如果null值很少,不會對我們計算總和或平均值造成很大的波動,那我們可以直接忽略。
若有些null值在處理時希望直接作為髒數據整行剔除時,則可以使用表頭的快捷過濾迅速的將空值進行排除。
透過表頭過濾快速找出空值,並進一步選擇是否要過濾掉
以上都是簡單的場景處理,而在實際業務中,可能會遇到null值存在業務含義的情況,
例如:範例中的數據,這位同學英語成績為空的原因可能是他本身就因病沒參加考試,此時既不能放著不管,也不能直接刪去他的這一行數據。
對於這種情況,我們要做的是針對某一類特殊情況打上對應的標籤,以便在後續的分析中,有選擇地過濾。在FineBI中,可以用**“新增公式列”或者更方便的“條件標籤列”**來實現。
對存在空值成績的同學打上缺考標籤
注:合併分析可指從其他表新增列,左右合併,上下合併。
**實際業務中,我們所需要的數據往往來自於多張表。在分析前,另外一個大難題就是,如何合併這些表。**我們為剛上手BI的業務,歸納了以下兩種合併的場景。
我們首先想象合併後表的狀態,一種是表格上下擴充套件,分析的欄位並沒有增加,但是行數變多了。此時可以使用**“上下合併”**快速完成表的拼接。
表格上下擴充套件,分析的欄位並沒有增加
另一種複雜的情況是合併後的表格是橫向擴充套件的,也就是分析的欄位變多了。
在討論左右合併前,我們不妨先看看**“其他表新增列”。
也許你對這個名字摸不著頭腦,但是肯定不會對Excel的Vlookup、Sumif感到陌生。**
沒錯!這個功能可以將其他表的指標欄位進行聚合後合併(Sumif)或是查詢對應的維度匹配到這張表中(Vlookup)。
成績根據要求求和後作為一個新的欄位,依據“姓名”合併到本表中
而對SQL老練的玩家來說,left join、right join…..可能更加親切,此時可以選擇BI數據編輯中的**“左右合併”**功能,與SQL的邏輯是一致的,有基礎的朋友可以很快上手。
在處理好了數據結構、並將多表進行合併處理後,我們需要停下來,審視一下自己所分析的問題,以及對應這個問題所需要的指標是否已經在表中了。
一般來說,事情可能沒有這麼順利,當然這也在常理之中,比如在零售行業的分析中,往往需要我們自己計算毛利率、增長率等指標。
在開始分析前,我們可以將這些計算指標增添到數據表中。怎麼做呢?
首先是最令人熟悉的“新增公式列”,這個功能和Excel中寫公式一樣,只需要輸入對應的公式就能產生對應的欄位。接著是一些常用計算的封裝功能,**“新增彙總列”**可以幫助我們進行簡單的聚合計算。
選擇對應的分組以及計算方式,對指標進行計算
而**“條件標籤列”這個功能則解決了眾多分析師日常最頭疼的IF巢狀問題**,不需要寫嵌套了七八層的IF公式,只需透過滑鼠配置不同的條件,就可以對數據賦予不同的標籤(值)。
透過新增特定條件篩選數據並賦予對應的標籤
剛接觸BI的朋友遇到最大的問題不僅在於不理解BI許多功能的計算邏輯,更在於由此產生的對數據處理結果的不信任。
“我這麼做,出來的結果是對的嗎”是新手朋友最常問自己的一個問題。
為了方便使用者進行校驗,數據編輯介面也內建了很多便利的功能。
選中欄位後,可以在左下角快速獲得平均值、總和、記錄數等數據,我們可以透過對熟悉的數據進行校驗,結合經驗來判斷是否正確。
數學成績欄位校驗得出平均分85.92,符合班級歷史平均水平
BI可以在處理步驟間插入新的步驟,同時也可以設定某些步驟暫時取消生效。
利用這一點,我們可以透過過濾出部分關鍵數據,並取消應用一些疑惑的關鍵步驟來進行試錯。就如同剛學數學時習慣性的多次驗算一樣,雖然對老玩家略顯繁瑣,但的確是最令新手放心的定心丸。
透過表頭快速過濾出少部分数据進行“抽樣檢測”
以上就是本期的內容分享~
如果覺得對你有一點點幫助,歡迎「追蹤」,「按贊」,「分享」喔,我會持續為大家創作優質的內容!
點選下方圖片免費體驗 FineBI工具demo